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基于 意见 领袖 的 微 博 生命 周期 预测 模型 研究 
黄 贤 英 ， 杨 林 枫 ?， 刘 小 洋 ， 高 民 东 


(重庆 理工 大 学 计算 机 科学 与 工程 学 院 , 重庆 400054) 


摘 要 : 为 了 有 效 研 究 社 交 网 络 中 意见 领袖 在 新 浪 微 博 传播 所 起 的 作用 及 微 博 的 生命 周期 和 传播 模式 ， 提 出 了 一 种 
OLB 微 博 传播 预测 模型 。 首 先 通过 爬 取 微 博 数据 ， 进 行 数据 分 析 ; 其 次 ， 拟 合 出 与 影响 力 有 关 的 四 个 因素 的 数学 表达 
式 ， 并 通过 层次 分 析 法 给 出 权重 计算 方法 ; 最 后 利用 计算 的 影响 力 以 及 转发 数 与 相关 因素 的 关系 构建 出 OLB 模型 ， 从 
而 对 意见 领袖 传播 作用 及 微 博 生命 周期 进行 实验 预测 分 析 。 仿 真 结果 表明 ， 在 微 博信 息 传播 中 意见 领袖 影响 力 与 其 微 
博 的 传播 作用 成 正比 例 关 系 , 通过 误差 分 析 得 到 四 组 数据 的 平均 误差 值 分 别 为 1.0%、5.0%、2.4% 及 5.1%, 提出 的 OLB 
模型 对 于 预测 微 博 传播 模式 合理 、 有 效 。 
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Research on life cycle prediction model of micro-blog based on opinion leaders 


Huang Xianying, Yang Linfeng’, Liu Xiaoyang, Gao Mindong 
(College of Computer Science & Engineering, Chongqing University of Technology, Chongqing 400054, China) 


Abstract: In order to study the role of opinion leaders in the dissemination of Sina micro-blog and the propagation mode of 


micro-blog's life cycle in social networks effectively, the paper proposed a propagation prediction OLB model. Firstly, we 
crawled the micro-blog data, then analyzed the data; Secondly, we fitted a mathematical expression of the four factors related to 


influence, and gave the weights calculation method through the analytic hierarchy process; Finally, we constructed the OLB 


model by using the influence of computation and the relationship between forwarding number and related factors. We analyzed 
the communication role of opinion leaders and micro-blog life cycle through the experiment. The simulation results showed that 
the influence of opinion leaders was positively proportional to the spread of micro-blog in micro-blog information dissemination. 
The average error of the four sets of data were 1.0%, 5.0%, 2.4% and 5.1% respectively by error analysis. The OLB model is 
reasonable and effective for predicting micro-blog propagation patterns. 


Key Words: Communication model; Opinion leader; Influence; Micro-blog life cycle 


微 博信 息 传播 等 进行 深入 研究 。 针 对 意见 领袖 ， 对 于 识别 意见 
领袖 尤为 重要 。 吴 渝 等 人 串通 过 对 提出 一 种 新 的 基于 用 户 影响 
微 博 的 兴起 改变 了 人 人们 的 生活 ， 作 为 一 种 新 兴 社 交 网 络 媒 ” 力 的 PageRank 意见 领袖 的 识别 方法 ， 发 现 意 见 领 袖 是 随时 让 
体 , 其 特点 是 文本 短小 , 内 容 精 炼 , 信息 传播 速度 快 。 近年 来 ， 的 变化 而 变化 ， 只 有 很 少 的 用 户 在 不 同 的 时 间 段 一 直 是 意见 领 
人 们 获取 新 闻 的 第 一 途径 已 经 逐渐 转变 为 微 博 。 微 博 在 社交 网 。 袖 ; 张 树 森 、 梁 循 等 人 只 根据 角色 是 否 提 前 定义 , 将 社会 网 络 
络 中 扮演 十 分 重要 的 角色 0 。 而 意见 领袖 作为 信息 传播 当中 的 色 分 为 非 明确 和 明确 角色 ,发 现 社 会 网 络 角 色 的 识别 需要 用 “组 
媒介 ， 使 信息 传播 形成 二 级 传播 ， 通 过 意见 领袖 造成 信息 传播 ” 合 产 ”方式 来 解决 , 识别 出 社会 角色 ; Li 等 人 外 提出 一 个 框架 ， 
的 社会 与 论 也 存在 重大 影响 ， 引 起 更 多 的 研究 者 关注 ， 故 对 微 通过 检索 内 容 分 析 微 博 因 素来 识别 标志 的 意见 领袖 和 最 大 化 的 
博 意见 领袖 影响 力 的 以 及 微 博 生 命 周 期 的 建 模 与 分 析 是 在 线 社 。 “信息 传播 ， 吴 岗 辉 等 人 外 提 出 一 种 基于 用 户 行为 网 络 的 意见 领 
交 网 络 研究 当中 最 前 沿 的 问题 之 一 。 袖 挖 掘 算法 . 并 采用 微 博 内 容 和 社交 属性 ， 挖 掘 微 博 中 的 意见 

近 些 年 国内 外 诸多 研究 学 者 都 对 在 线 社 交 网 络 ,复杂 网 络 、 ” 领袖。 在 识别 过 程 中 ， 运 用 算法 作为 识别 方法 进行 识别 。 对 意 
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见 领袖 的 识别 工作 逐渐 成 熟 ， 而 对 意见 领袖 的 传播 方式 却 研究 全 交 网 络 行为 进行 分 析 具 有 重大 意义 。 目 前 ， 新 浪 微 博 月 活跃 
较 少 。 用 户 平 均 已 达 3 亿 ， 而 日 活跃 用 户 平均 也 有 1 亿 以 上 。 

为 了 对 意见 领袖 在 原创 或 转发 后 的 微 博 生命 周期 进行 分 析 ， 微 博 原创 发 送 及 微 博 转发 都 是 信息 传播 行为 ， 本 文 将 会 
首先 要 构建 意见 领袖 传播 力 以 及 影响 力 因 素 指标 。 在 在 这 之 前 ”” 究 微 博 生 命 周 期 行为 特征 ， 主 要 是 一 条 微 博 发 送 或 转发 之 后 ， 
需要 获取 微 博 数据 ，Deng 等 个 构建 了 一 个 基于 新 浪 微 博 API ”经历 潜伏 期 ,激增 期 、 二 次 增长 期 最 后 到 达 衰 亡 期 的 规律 特征 ， 
的 微 博 息 行 分 析 工 具 。 这 种 基于 微 博 客 的 新 的 MapReduce 得 到 ”以 意见 领袖 作为 研究 对 象 ， 分 析 其 在 发 送 或 转发 微 博之 后 的 微 
更 好 的 精度 和 更 少 的 运行 时 间 检 测 微 博客 核心 意见 领袖 ， 李 玉 ” 博 传 播 模 式 。 

贞 等 人 9 提出 以 活跃 度 、 传 播 力 和 禾 盖 度 三 个 指标 来 评估 微 博 
意见 领袖 的 影响 力 ， 赵 惠 东 等 人 中 利用 直接 粉丝 与 间接 粉丝 构 
造影 响 力 计算 方法 ， 并 建立 模型 用 以 预测 微 博 转 发 量 ， 张 仰 森 
等 他 采用 层次 分 析 提 出 了 用 户 初始 影响 力 的 计算 模型 。 并 借 
鉴 PageRank 算法 思想 ， 提 出 了 用 户 初始 影响 力 扩 散 的 计算 方 
式 ; 冯 时 等 个 提出 了 一 种 基于 LDA 语义 信息 和 HowNet 知识 
库 的 短文 本 子 话题 分 类 算法 。 对 分 类 后 的 微 博 从 显 式 、 隐 式 及 
用 户 等 方面 综合 衡量 微 博 的 影响 力 ; 丁 兆 云 等 人 (9 提出 了 基于 
多 关系 网 络 的 随机 游 走 模型 MultiRank， 将 影响 力 个 体 根据 其 
影响 力 属 性 划分 ， 结 果 表 明 多 话题 层次 影响 力 个 体 数 目 相对 所 
有 影响 力 个 体 仅 占 少 部 分 。 而 对 于 微 博 内 容 的 分 析 也 十 分 有 必 


转发 数 (次 ) 


图 1 微 博 生命 周期 示意 图 


要 ， 董 雨 展 ， 刘 下 等 人 (1 利用 社团 模块 度 、 平 均 最 短路 径 和 网 

络 直径 这 三 个 属性 度量 该 网 络 的 紧密 程度 ， 基 于 支持 向 量 机 对 从 图 1 可 清晰 看 出 一 条 微 博 的 生命 周期 所 经 历 的 各 个 阶段 ， 

所 抽取 的 微 博 进行 分 类 ,进而 识别 出 炒作 微 博 。 将 机 器 学 习 算法 条 曲线 分 别 描述 了 三 类 典型 微 博 的 传播 模式 。 

与 微 博 分 类 结合 起 来 可 以 对 微 博 进 行 分 类 51。 对 于 以 上 研究 本 文 所 用 到 的 数据 将 采用 故 虫 方式 爬 取 数据 ， 由 于 微 博 对 

均 可 作为 对 一 条 突 发 事件 微 博 的 生命 周期 进行 分 析 的 预 处 理工 ”用 户 信息 有 所 保护 ， 在 爬 取 过 程 中 ， 如 果 在 某 个 时 间 段 一 个 用 

作 。 户 对 微 博 页 面 访 问 量 太 大 ， 将 会 封号 ， 故 息 取 过 程 利用 三 个 账 
而 对 于 微 博 传 播 模式 的 研究 及 微 博 传播 方式 预测 同样 非常 号， 分 别 爬 取 相 关 人 信息。 首先 对 微 博 名 人 和 交 中 的 200 个 用 户 进 

重要 。Wei 等 人 0 提出 三 种 信息 发 布 模式 并 基于 构造 了 三 种 不 ”，” 行 肘 了 到， 分 别 爬 取 每 个 用 户 的 总 微 博 量 、 原 创 微 博 量 、 关 注 列 


同 的 扩散 模型 ; Tang 等 人 03 提 出 一 种 基于 兴趣 的 动态 交友 网 络 ， ” 表 数 、 影 响 力 大 小 以 及 粉丝 数量 ; 并 爬 取 每 个 用 户 的 50 篇 微 博 
并 构建 了 一 种 扩散 模型 ，Zhang 等 人 0 提出 了 一 种 新 的 方法 来 j 来 计算 其 平均 评论 量 以 及 平均 转发 量 ， 而 活跃 度 通过 微 博 用 
检测 突 发 事件 , 并 预测 他 们 未 来 的 发 展 ; Jalali 等 人 03 基 于 经 验 站 总 微 博 量 、 平 均 每 天 发 表 微 博 数 以 及 活跃 天 数 来 拟 合 。 对 的 
数据 ， 提 出 了 一 种 DY 动态 模型 并 利用 最 大 似 然 估 计 给 出 模型 ” 取 的 200 个 用 户 进行 一 次 筛选 ， 去 掉 评 论 数 及 转发 数 极 低 的 以 
的 测试 和 校准 方法 ;Long 等 人 09 提 出 了 一 种 新 的 基于 定向 网 络 。 及 重复 的 人 ， 得 到 172 名 用 户 。 其 次 对 微 博 的 热 搜 数据 进行 仆 
的 重合 社区 标志 算法 结果 表明 : 本 研究 中 的 社区 识别 算法 实现 。 取 ， 扑 取 时 间 从 2017 年 3 月 20 日 到 2017 年 6 月 30 日 每 天 任 
了 有 向 图 到 加 权 无 向 图 的 转换 ， 扩 展 了 整个 社区 的 重合 网 络 社 。 选 两 个 时 间 点 。 每 个 时 间 点 只 取 8 个 热门 话题 ， 两 个 月 共 除 去 
区 。 对 于 传播 模式 的 研究 中 ， 没 有 用 数学 建 模 的 思想 考虑 微 博 。 重复 话题 共 取 到 508 个 热门 话题 。 其 中 每 个 话题 涉及 的 微 博 数 
生命 周期 ,同时 也 没有 考虑 在 传播 过 程 中 意见 领袖 所 起 的 作用 。 参差 不 齐 ， 其 中 也 有 普通 大 众 为 了 路 热 度 而 发 布 的 与 话题 毫 
从 国内 外 相关 研究 学 者 对 在 线 社交 网 络 传播 中 意见 领袖 所 ”无 关系 的 微 博 ， 故 每 个 话题 只 取 评 论 转发 较 高 的 1~3 篇 分 析 ， 
起 的 作用 研究 表明 传播 过 程 中 意见 领袖 具有 重要 意义 及 作用 。 最 后 共 取 到 822 篇 微 博 。 其 中 涉及 的 意见 领袖 共 1183 人 。 下 面 
微 博 的 发 展 速 度 迅 猛 ， 近 年 来 微 博 及 各 类 社交 网 络 软件 信息 传 ”将 对 采集 到 的 因素 数据 分 析 研 究 ， 并 对 热 搜 微 博 数据 进行 分 析 
播 量 大 ， 传 播 力度 广 ， 且 和 人们 通过 微 博 获取 日 常 新 闻 是 一 种 普 。 建 模 研 究 。 
遍 现象 ， 故 对 社交 网 络 研究 。 本 文 将 基于 新 浪 微 博 对 其 中 各 因 ce ee 
素 进行 指标 分 析 ， 计 算 相 关 因 素 的 权重 ， 分 析出 意见 领袖 影响 和 
力 。 并 构建 数学 模型 分 析 微 博 生 命 周期 。 进行 相关 数据 采集 后 ， 将 微 博 各 因素 数据 归 类 ， 并 对 意见 
1 ”数据 采集 领袖 影响 力 进行 研究 。 首 先 对 微 博 的 传播 模式 进行 分 析 ， 其 次 
将 会 对 于 扑 取 到 的 与 意见 领袖 影响 力 有 关 的 各 个 指标 ， 对 其 分 
新 浪 微 博 作 为 国内 最 大 的 网 络 媒体 ， 也 是 全 球 使 用 最 多 的 。 析 。 最 后 构建 意见 领袖 影响 力 权 重 计算 方式 。 指 标 分 类 如 表 1 
微型 博客 提供 商 之 一 。 产 生 的 数据 量 巨大 ， 用 新 浪 微 博 对 在 线 。 所 示 。 
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若 仅 考虑 微 博 的 意见 领 


1 


意见 领 


影响 力 指标 分 类 


意见 领袖 传播 力 指标 


意见 领袖 活跃 度 指 标 


粉丝 数 
微 博 被 评论 数 
微 博 被 转发 数 


发 表 微 博 总 数 
平均 每 天 发 表 微 博 数 
活跃 天 数 


传播 力 ， 并 不 能 准确 计算 和 分 析 


其 影响 力 ;， 则 引入 发 表 微 博 总 数 、 平 均 每 天 发 表 微 博 数 、 活 跃 
天 数 这 三 个 因素 来 构建 意见 领袖 活跃 度 ， 如 表 1 所 示 ; 意见 领 
袖 活 跃 度 与 此 三 个 因素 均 成 正比 关系 。 


2.1 


意见 


Se 


领袖 粉丝 数量 ; 
博 转 发 数量 ; 


意见 领袖 相关 因素 分 析 


天 = 


分 析 以 发 现 因素 的 相关 关系 。 


列表 的 数量 


对 把 取 到 的 数据 。 将 影响 力 通 过 式 (1) 进 行 归 


化 处 理 o 
X i Xi 
LX (D) 
意见 领袖 关注 列表 的 数量 ; 


意见 领袖 转发 微 博 的 总 数量 ; 
意见 领袖 微 博 平均 评论 数量 ， 意 见 
意见 领袖 活跃 度 分 别 与 意见 领袖 影响 力 进行 绘 


领袖 微 


以 及 意见 领袖 的 活跃 度 四 个 因素 确实 与 意见 领袖 影响 力 存在 函 


数 关 系 ， 接 下 来 分 析 拟 合 ! 


线 的 误差 及 各 指标 值 。 
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图 3 各 因素 与 意见 领袖 影响 力 拟 合 关 系 图 
根据 表 2 中 的 各 指标 首先 可 以 分 析出 四 个 因素 与 影响 力 都 


存在 线性 关系 ， 其 次 发 现 与 影响 力 关 系 最 大 的 指标 是 微 博 转 发 


医 


三 | 


宙 
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避 
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5 1 15 
领袖 转发 微 博 的 数量 (个 )x10* 
(a) 


e 
2 

意见 领袖 关注 列表 数量 (个 ) 

Cb) 


局 047 2 
本 "| go 
宜 02 

ql 
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根据 图 2 可 


因素 / 


V. 


comment 下 


数值 进行 归 


式 (1) 将 其 


05 1 15 2 25 
意见 领袖 微 博 转发 数量 (个 ) x105 
tey) 


以 看 出 意见 领袖 所 转发 微 博 的 数量 以 及 其 关注 
对 意见 领袖 的 影响 力 不 存 在 
一 化 至 区 间 


领袖 影响 力 


意见 


60 
意见 领袖 活跃 度 
(Cf) 


2 不 同 因素 与 意见 领袖 影响 力 关 系 


关系 最 小 的 是 意见 领袖 的 粉丝 数量 。 


表 2 拟 合 曲线 指标 分 析 表 
指标 SSE  R-square Adjusted R-square RMSE 
粉丝 量 - 影 响 力 2.811 0.4128 0.4087 0.1297 
评论 量 -影响 力 1.894 ”0.6584 0.6564 0.1056 
转发 量 -影响 力 ”0.4294 ”0.9226 0.9221 0.05026 
活跃 度 - 影 响 力 1.055 ”0.8097 0.8085 0.07879 


ee 


2.2 意见 


领袖 影响 力 构建 与 分 析 


微 博 在 通过 


大 影响 的 是 意 


素 共同 构成 ， 


意见 领袖 影响 力 越 大 ， 其 带 来 的 网 络 传播 力度 越 
社会 影响 越 大 。 故 将 利用 
数 及 活跃 度 结合 式 (6) 来 计算 


用 了 表示 。 


数 三 因素 分 别 


意见 领 4 


f 三 WV + Wo * WV ma + WV 


其 中 : 活跃 度 是 1 


归 


函数 关系 ， 对 其 他 四 个 
[0.1]] ,然后 分 别 用 站 


Vi rward 


影响 力 的 关系 进行 函数 拟 合 。 


以 及 Va 来 表示 o 并 对 


fans 、 
2 中 其 他 四 个 因素 对 


区 


图 3 可 以 看 出 四 个 因素 对 影响 力 均 存 在 函数 关系 ， 通 过 
拟 合 出 的 四 条 线性 直线 可 得 式 (2)~ (5)。 
Vi = 0.469x7,,, + 0.042 O) 
Viommenr =1.081x.omen 十 0.118 03) 
Tina = 0.684x6, aa + 0.084 (4) 
Vein = 0.691x,0n 一 0.0592 (5) 


通过 式 (2)~(5) 可 得 意见 领 N 


粉丝 数 、 微 博 评 论 数 、 转 发 数 


意见 领 


接着 将 确 


定 各 


据 归 一 化 处 


可 以 


寻 素 在 影 


见 领袖 的 影响 力 ， 因 影响 力 这 个 指标 是 
所 以 影响 力 对 于 信息 的 传播 起 到 关键 性 作 


传播 的 过 程 中 ， 对 其 传播 作用 起 到 最 


多 个 因 
和 ， 即 
三 ， 所 造成 的 


4 


有 意见 领袖 粉丝 数 、 微 博 评 论 数 、 转 发 


影响 力 。 意见 人 


> 
党 
人 


(6) 


微 博 总 数 、 平 均 每 天 发 表 微 博 数 以 及 活跃 天 
化 并 相 加 取 平 均 得 到 。 
向 力 计 算 中 的 权 值 ， 对 属性 矩阵 数 


在 [0 范 


中 的 重要 性 不 能 确 
的 10 级 重要 
各 个 属性 指标 的 相对 重要 性 。 比 如 ， 
t 与 微 博 转发 数 如 和 意见 领袖 活跃 度 国 相 比 相 


Saaty 


数量 


定 ， 因 此 还 需要 确 


围 内 比较 数据 ， 但 各 


轴 性 值 在 评价 


定 属性 的 权重 值 。 采 用 


性 等 级 表 和 


[ea 


可 


比较 的 判断 矩 


F 价 人 认为 


讲 


阵 专 家 法 计算 
意见 领袖 粉丝 


a 


要 ， 


中 


则 可 取 刀 = 加 =5:， 相 比较 明显 可 以 取 7， 介 于 相当 重要 和 


显 重要 之 间 可 以 取 6;， 介 于 略微 
依次 对 各 个 指标 进行 比较 后 ， 运 用 
对 重要 性 判断 矩阵 。 
据 ， 如 表 2 所 示 


o 


有 要 与 相当 和 
层次 分 析 法 ， 则 得 到 
最 后 通过 一 致 性 检验 来 确定 各 因素 权重 数 


要 之 间 可 以 取 4。 


属性 相 
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意见 领袖 影响 力 f 的 大 小 可 以 影响 信息 传播 的 力度 ， 而 一 
跃 度 条 微 博 的 转发 数 主要 跟 信息 的 传播 力度 有 关 ， 信 息 的 传播 力度 
越 大 ， 就 能 使 更 多 人 看 到 ， 所 造成 的 微 博 转 发 数 也 就 越 大 。 意 


表 3 意见 领袖 影响 力 因 素 权重 
因素 “粉丝 数量 《平均 评论 数 ”平均 转发 数 活 


权重 0.22 0.12 0.36 0.30 
见 领袖 影响 力 根据 式 (2)~ 式 (5) 结 合 权重 计算 式 (7) 进 行 计算 ， 下 

通过 表 3 中 的 权重 来 计算 意见 领袖 的 影响 力 ， 从 而 更 好 的 一 步 将 判断 计算 出 的 意见 领袖 影响 力 f 跟 相 应 的 转发 数 

分 析 微 博 生 命 周期 。( 无 特殊 情况 外 ， 转 发 量 高 于 10 万 的 微 博 NN jmwara 存在 什么 样 的 函数 关系 ， 对 两 个 因素 进行 拟 合 分 析 得 到 


都 认为 有 水 军 参加 ， 忽 略 这 些 转发 量 ， 本 文 将 微 博 实际 转发 量 图 5。 
超过 10 万 的 定义 为 10 万 )。 


3 ”提出 的 意见 领袖 OLB 传播 模型 


3.1 微 博 生命 周期 分 析 
从 数据 采集 的 822 篇 微 博 中 随机 挑选 10% 即 82 篇 微 博 进 


炒 
行 分 析 ， 可 以 看 出 一 条 热门 微 博 的 生命 周期 ， 主 要 是 两 种 传播 3 
模式 ， 如 图 4 所 示 。 图 4 的 生命 周期 与 图 1 的 生命 周期 有 所 区 
别 ， 主 要 是 新 浪 微 博 因 其 实时 性 较 高 ， 在 其 发 布 的 第 一 时 间 内 : 
就 会 得 到 普通 大 众 及 意见 领袖 的 传播 ， 故 在 其 生命 周期 中 很 少 
会 存在 潜伏 期 阶段 。 | 
0 和 0.1 0.2 0 4 Di6 6 0.7 
一 二 意见 领袖 影响 力 
1000 上 乓 2 | 
. 并 加 5。 影响 力 与 转发 数 关系 曲线 
蛇 党 
二 500 上 拉 Lp 帆 音 岂 媚 袖 开 的 | 季 Ra 甘 时 2 
裕 人 由 图 5 可 以 看 出 意见 领袖 平均 微 博 转发 数 与 其 影响 力 存在 
时 刻 (单位 ， 小 时 ) 函数 关系 。 且 保持 正比 例 递 增 。 拟 合 得 到 的 及 -square 值 为 


0 10 20 30 40 50 60 二 六 
时 刻 (单位 : 小 时 ) 0.9473， 说 明 拟 合 结果 有 
(a) 


ee oe (7) 
1000 上 
be N orwara > 29.3f (8) 
乓 500 上 
了 一 条 微 博 的 激增 期 ， 转 发 数 会 随时 间 上 的 增加 而 增 大 ， 但 
: 0 gy py pr = ee 转发 数 最 终 会 达到 一 个 稳定 不 变 的 状态 ， 把 转发 数 增长 的 这 段 
一 时 间 称 为 影响 力 持 续 时 间 t.， 当 1<t 时 ， 微 博 转发 数 在 激增 ， 
ro 可 用 式 (9) 来 拟 合 出 转发 数 在 激增 过 程 中 的 大 体 变 化 趋势 ，t 作 
图 4 一 条 — 典 型 微 博 的 传播 模式 图 本 
为 时 间 控 制 参数 。 

一 条 微 博 的 生命 周期 主要 由 潜伏 期 、 激 增 期 、 二 次 增长 期 、 y=1-e™*™? (9) 
衰亡 期 构成 。 图 4 中 的 黑色 阴影 部 分 是 以 每 小 时 微 博 的 转发 量 对 微 博 转 发 数 的 总 值 在 模型 中 引入 放大 级 数 8 ， 放 大 级 数 
画图 所 得 ， 图 4 右上 角 的 曲线 部 分 是 将 每 个 小 时 的 转发 量 累加 是 对 数学 模型 计算 出 的 转发 数 进行 实际 放大 ， 发 现 放 大 级 数 与 
起 来 所 画 出 的 图 ， 其 可 以 描述 一 条 典型 微 博 的 两 种 不 同 的 传 意见 领袖 影响 力 存在 关系 ， 其 增 大 方式 是 影响 力 越 大 ， 放 大 级 


模式 。 图 4(a) 中 是 微 博 再 转发 之 后 由 激增 到 达 衰 亡 的 过 程 ， 数 也 就 越 大 ， 函 数 关系 如 式 (10) 所 示 。 


一 
党 扣 员 沁 


过 右上 角 小 图 可 以 明显 看 到 激增 期 以 及 衰亡 期 两 个 阶段 ， 了 10f 0<f <0.08 
4(b) 相 对 于 图 4(a) 多 了 一 个 二 次 增长 的 阶段 ， 二 次 增长 主要 2 0.08 < f <0.25 pi 
于 在 微 博 转 发 数量 已 经 达到 平稳 阶段 后 又 被 一 影响 力 大 的 34.375f -8.2125 0.25<f <0.35 


11.165f —0.878 0.35<f <l 
1<t. 时, 微 博 生 命 状 态 处 于 激增 阶段 ， 此 时 微 博 转 发 数 
快速 增长 ， 如 式 (11) 所 示 。 


见 领 袖 进行 转发 导致 ,， 微 博 转发 数 进行 二 次 增长 。 
3.2 ”OLB 模型 建立 

一 般 情况 下 ， 意 见 领袖 的 影响 力 在 信息 传播 过 程 中 在 逐步 。 随时 
衰减 , 本 文中 , 意见 领袖 影响 力 由 2.1 节 和 2.2 节 所 提出 来 的 四 
个 因素 构建 。 并 且 假定 在 信息 传播 过 程 中 ， 粉 丝 数 mw 、 微 博 
评论 数 nwwwn 、 微 博 转发 数 pm 以 及 活跃 度 nmin 不 会 发 生变 当 1=1 时， 微 博 生命 状态 处 于 激增 结束 阶段 ， 开 始 缓慢 增 
化 。 加 至 稳定 态 。 此 时 可 以 根据 式 (1D) 计 算出 最 终 转发 数 。 


4 蜗 


I 


| 


N omward = 10f* +pBU-— ey) (11) 


荆 
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录用 稿 


对 计算 出 的 转发 数 , 需 对 模型 转发 数 Warmws 与 Wew 进行 误 


差分 析 ， 利 用 式 (12)~(13) 进 行 误差 计 算 并 进行 分 析 。 
N. 一 AN， 
6 二 | Jorward real (12) 
Na 
Ft + +O, (13) 
n 


根据 计算 出 的 误差 平均 值 5 的 大 小 可 以 分 析 OLB 模型 的 


有 效 性 以 及 是 否 具 有 实际 意义 。 


4 “仿真 结果 与 分 析 
本 文 仿真 数据 利用 热门 微 博 进 行 仿真 ， 构 建 的 微 博 意见 领 
袖 预测 模型 是 针对 意见 领袖 发 送 的 原创 微 博 有 效 。 而 由 于 一 般 
微 博 评 论 量 及 转发 量 均 具有 随机 性 ， 则 提出 的 预测 模型 适用 于 
意见 领袖 的 热门 微 博 。 
4.1 微 博 热 搜 微 博 热度 分 析 
在 之 前 爬 取 的 数据 中 选取 四 个 不 同类 别 且 转发 量 多 的 话题 ， 
以 拟 合 微 博 事件 热度 图 ， 可 以 分 析 一 个 话题 从 出 现 并 被 人 们 关 
注 的 热度 变化 趋势 。 仿 真 前 将 数值 归 一 化 。 
12 上 
一 一 比特 币 勒索 
一 -一 - 杭州 纵火 案 
党 二 一 一 蔡康永 电影 宣传 | j 
sl 0.8 
四 
i 
蜡 0.6 
0.4F 
0.2 E 
0 ~ 1 1 1 1 1 和 
0 5 10 15 20 25 30 35 40 45 50 


涉 
洱 


增 力 
4.2 


度 也 会 降低 ， 各 路 媒体 会 在 人 们 淡忘 时 爆 出 话题 的 附属 事件 即 
可 引起 更 大 关注 量 ， 


时 间 小时》 


图 6 微 博 话 题 热 


六 


图 6 可 以 看 出 一 个 话题 在 发 布 后 ， 人 们 对 其 极为 关注 ， 
也 在 攀升 ， 但 当时 间 逐 渐 增 加 ， 事 件 将 会 被 人 们 淡忘 ， 热 


使 人 们 重新 关注 事件 ， 事 件 的 热度 会 再 次 
1H， 如 此 循环 ， 最 后 热度 会 降 到 最 低 。 

真实 数据 与 提出 的 OLB 模型 对 比分 析 
热度 分 析 中 的 4 个 不 同 话题 的 微 博 进行 分 析 ， 首 先 对 
领袖 粉丝 数 及 活跃 度 进行 仿真 分 析 ， 其 次 从 转发 的 人 当中 


寻找 意见 领 
各 因素 均 采集 近 一 年 内 的 数据 ， 


， 并 计算 意见 领袖 的 影响 力 f ， 在 计算 影响 力 时 
最 后 进行 真实 数据 、 传 统 模型 


方法 以 及 OLB 模型 的 对 比 仿真 分 析 ( 其 中 用 不 同 颜色 代表 不 同 


的 意见 领袖 ), 其 中 采用 文献 [7] 中 的 模型 , 此 方法 当前 运 ) 


] 较 多 ， 


时 刻 转 发 量 进行 预测 , 本 文 将 其 转发 量 累积 起 来 进行 对 比 ， 


效果 更 直观 。 


星 


意见 领袖 都 帮 其 转发 宣传 ， 起 到 信息 传播 的 作 / 


表 4 蔡康永 发 布 电影 宣传 微 博 参数 
意见 领袖 杨 需 。 王 嘉 尔 ”范冰冰 ”张大 大 
传播 力 f 0.625 0.316 0.268 0.051 
放大 级 数 6.10 2.65 1.00 0.51 
转发 间隔 时 间 ( 天 ) 0.20 0.13 0.29 0.42 
实际 转发 量 (万 ) ”12.35 3.66 1.70 0.54 


如 表 4 是 针对 蔡康永 首部 导演 作品 所 发 的 宣传 微 博 ， 各 明 
j， 其 中 筛选 


出 杨 寡 、 王 嘉 尔 、 范 冰冰 、 张 大 大 四 个 意见 领袖 进行 模型 与 真 


实数 据 的 仿真 分 析 。 


规律 。 
快 ， 在 信息 出 现 后 ， 迅 速 关注 令 其 热度 的 传播 速度 达到 一 个 


很 


峰值 又 迅速 
个 高 点 后 不 会 再 变化 。 
播 作 | 
当中 起 较 大 作 | 


一 一 0LB 模 型 
一 一 真实 数据 
一 -一 -文献 [7] 模 型 | | 


转发 累积 量 (万 条 ) 


时 刻 (天 ) 


素 永 发 布 电影 宣传 微 博 生 命 周 期 


据 图 7 可 以 得 到 ， 意 见 领袖 在 转发 别人 微 博 的 时 间 点 没有 
而 特征 都 为 先 激增 后 衰亡 ， 因 为 人 们 对 信息 的 消化 时 间 


降 至 零 ， 表 现在 微 博 累积 转发 量 当 中 即 为 达到 一 
且 从 图 中 可 以 看 出 ， 杨 寡 对 信息 的 传 
j 力 最 大 ， 其 在 娱乐 图 有 较 大 影响 力 。 才 导致 在 信息 传播 
]， 而 单 四 个 意见 领袖 的 转发 量 就 占 总 转发 量 的 


57%, 可 见 意 见 领袖 在 微 博 传播 中 的 作用 之 大 ,真实 数据 与 OLB 
模型 误差 平均 值 为 1.8%, 与 传统 模型 对 比 发 现 传统 方法 两 个 意 


见 


为 


领袖 的 误差 很 大 ， 其 他 两 个 接近 。 
表 5 乐天 萨 德 ”事件 微 博 参数 
意见 领袖 I Happy 张江 
的 视频 ”是 个 极品 

传播 力 了 0.281 0.080 0.035 

放大 级 数 1.45 0.80 0.35 
转发 间隔 时 间 ( 天 ) 0.13 0.23 1.05 
实际 转发 量 (万 ) 2.17 0.88 0.33 


而 表 5 是 关于 “乐天 萨 德 ”事件 微 博 ， 涉 及 的 意见 领袖 多 
自 媒 体 ， 微 博 自 媒体 是 微 博时 代 产 生 的 一 种 通过 微 博 传播 信 
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息 的 网 络 媒 体 ， 其 影响 力 在 信息 传播 中 也 起 很 大 的 作用 。 如 图 9 和 前 两 组 数据 一 样 选 三 个 有 代表 性 的 意见 领袖 进行 
仿真 分 析 。 可 以 看 出 其 在 IT 行业 中 的 传播 模式 依旧 保持 增长 达 


a 到 峰值 即 保持 不 变 。 此 图 中 三 个 意见 领袖 造成 的 传播 量 占 总 传 

ee 播 量 的 54%， 意 见 领 袖 在 微 博 信息 传播 当中 依旧 体现 出 很 大 的 

2.5T 一 一 文献 [7] 模 型 | ] 作用 ,而 真实 数据 与 OLB 模型 对 比 的 误差 平均 值 为 2.4%, OLB 
模型 中 有 两 个 意见 领袖 都 优 于 传统 模型 。 


IN 
T 


表 7 杭州 纵火 案 ” 微 博 参 数 
意见 领袖 休闲 璐 ” 马 思 纯 夏目 家 的 小 诗 


3 加 


转发 累积 量 (万 条 ) 
加 


传播 力 了 0.184 0.089 0.053 
| 放大 级 数 0.91 0.79 0.53 
ool |; 转发 间隔 时 间 (天 ) 。 0.03 0.08 0.44 
实际 转发 量 ( 万 ) 1.3 0.83 0.61 
0 表 7 数据 为 6 月份 震惊 社会 的 “杭州 纵火 案 ” 事件， 此 事 
加 本 件 的 影响 之 大 导致 涉及 的 意见 领袖 较 多 ， 选 取 的 微 博 来 自 受害 
图 8 乐天 萨 德 ” 事 件 微 博 生命 周期 轩 
De 家 庭 的 男 主人 所 发 送 微 博 ， 因 为 事件 过 于 恶劣 ， 导 致 各 方 意见 
之 图 8 依旧 在 时 间 点 上 没有 规律 ， 而 且 关 于 这 种 政治 方面 的 领袖 : 自 媒体 、 明 星 以 及 新 闻 媒 体 都 有 参与 。 
Le 问题 多 为 自 媒 体 进行 转发 传播 , 一些 知 名 人 士 不 方便 公开 表态 。 


关于 传播 模式 还 是 先 激 增 后 衰亡 ,人 们 很 快 失去 对 信息 的 兴趣 。 
而 三 个 微 博 自 媒体 的 转发 量 占 总 转发 量 的 59%， 在 传播 过 程 中 
意见 领袖 起 很 大 影响 。 而 比较 后 的 平均 误差 为 5.0%, 与 传统 模 
型 对 比 发 现 OLB 模型 对 其 中 两 个 意见 领袖 表现 更 优秀 。 


表 6 比特 币 勒 索 病毒 ”解决 方法 微 博 参 数 


转发 累积 量 (万 条 ) 


意见 领袖 黑客 凯 文 ”夏目 家 的 小 诗 哥 ” 游 研 社 
传播 力 f 0.297 0.053 0.007 
放大 级 数 1.65 0.53 0.07 
转发 间隔 时 间 ( 天 ) 0.2 0.44 1.06 
实际 转发 量 (万 ) 2.52 0.59 0.07 
es 时 刻 ( 天 ) 


《) 表 6 是 3 月 爆发 的 “比特 币 勒索 病毒 ”事件 ， 作 为 一 种 病 
毒 软件 ， 锁 定 各 种 文件 ， 付 费解 锁 。 造 成 至 少 150 个 国家 ，30 
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万 名 用 户 中 招 、 损失 达 80 亿美 元 。 与 此 话题 相关 的 意见 领袖 多 图 10 中 相对 误差 比 前 三 组 数据 较 明 显 ， 原 因 是 微 博 当中 
位 开行 业 意见 领袖 用户“ 黑客 凯 文 ”发 表 中 此 病毒 后 如 何 解 ”的 多 级 传播 ， 在 微 博 中 可 能 一 个 影响 力 较 小 的 意见 领袖 的 微 博 
决 的 微 博 。 被 一 个 影响 力 较 大 的 意见 领袖 所 转发 ， 将 会 导致 前 者 的 转发 量 
与 实际 传播 效果 不 成 比例 。 上 例 中 的 真实 数据 与 模型 误差 平均 
1 值 为 5.1%， 图 中 OLB 模型 针对 三 个 意见 领袖 误差 都 小 于 传统 
模型 。 
x 利用 图 7~10 可 以 得 出 OLB 模型 针对 意见 领袖 进行 微 博 预 
和 | 测 优 于 传统 模型 。 证明 OLB 模型 合理 有 效 ， 对 于 预测 微 博 有 意 
&' 义 。 
多 4.3 ”误差 分 析 


在 对 四 组 微 博 数据 进行 仿真 分 析 后 ， 得 到 OLB 模型 在 预 
测 意见 领袖 转发 微 博 后 的 生命 周期 有 着 明显 的 有 效 性 。 进 行 误 
差 计算 之 后 得 到 四 组 微 博 的 平均 误差 值 分 别 为 1.0%、5.0%、2.4% 
以 及 5.1%。 对 于 每 个 人 的 误差 与 文献 [7] 中 模型 对 比分 析 如 图 
11 所 示 。 


图 9 比特 币 勒 索 病 毒 ” 解 决 方法 微 博 生 命 周 期 
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微 博通 过 意 


见 领袖 的 传播 可 


当中 模型 可 以 较 好 的 起 到 预测 


对 于 预测 微 博 的 生命 周期 没有 


本文 对 新 浪 微 博 中 的 微 博 特征 进行 预测 研究 ， 


致 一 条 微 博 


扩散 能 力 的 关键 


函数 拟 合 得 
以 及 其 活跃 


到 意见 领袖 粉丝 


以 达到 更 大 的 效果 ， 而 转发 量 
因素 ， 对 与 影响 力 有 关 的 因素 
量 、 微 博 平均 评论 量 、 平 均 转 


度 四 个 因素 与 意 


见 领袖 的 影响 力 有 线性 关系 ; 


利用 层次 分 


] 


四 


袖 的 相应 影响 力 大 小 ; 
基础 上 构建 了 OLB 数学 模型 。 最 后 通过 仿真 及 误差 分 析 验 证 
了 提出 的 OLB 模型 在 实际 应 用 的 有 效 性 。 下 一 步 本 文 将 对 微 
博 内 容 进行 分 类 、 对 意见 领袖 影 


析 法 对 四 个 因素 


赋予 相应 的 权重 ， 得 到 意见 领 


在 继续 分 


析 微 博 备 因素 间 的 相关 关系 的 


定 问题 进行 继续 研究 。 


响 力 的 持续 时 间 在 模型 中 的 界 
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